Как обеспечить устойчивость модели при появлении новых неизвестных признаков
▪️ Мониторинг данных — отслеживайте распределение признаков в продакшене, чтобы выявлять новые категории или признаки. Автоматические проверки помогут зафиксировать изменения.
▪️ Регулярное переобучение — настройте процесс периодического обновления модели, если новые признаки становятся значимой частью данных.
▪️ Эмбеддинги и хеширование — используйте методы, которые позволяют корректно обрабатывать ранее неизвестные категории.
▪️ Резервные представления — для неизвестных признаков можно использовать «unknown embedding» или специальный индекс, пока модель не будет обновлена.
Как обеспечить устойчивость модели при появлении новых неизвестных признаков
▪️ Мониторинг данных — отслеживайте распределение признаков в продакшене, чтобы выявлять новые категории или признаки. Автоматические проверки помогут зафиксировать изменения.
▪️ Регулярное переобучение — настройте процесс периодического обновления модели, если новые признаки становятся значимой частью данных.
▪️ Эмбеддинги и хеширование — используйте методы, которые позволяют корректно обрабатывать ранее неизвестные категории.
▪️ Резервные представления — для неизвестных признаков можно использовать «unknown embedding» или специальный индекс, пока модель не будет обновлена.
Telegram has exploded as a hub for cybercriminals looking to buy, sell and share stolen data and hacking tools, new research shows, as the messaging app emerges as an alternative to the dark web.An investigation by cyber intelligence group Cyberint, together with the Financial Times, found a ballooning network of hackers sharing data leaks on the popular messaging platform, sometimes in channels with tens of thousands of subscribers, lured by its ease of use and light-touch moderation.
Telegram is riding high, adding tens of million of users this year. Now the bill is coming due.Telegram is one of the few significant social-media challengers to Facebook Inc., FB -1.90% on a trajectory toward one billion users active each month by the end of 2022, up from roughly 550 million today.
Библиотека собеса по Data Science | вопросы с собеседований from fr